NLP 的機器學習模型:我們先前提到,現代 NLP 仰賴稱為機器學習的 AI 方法。機器學習可透過將資料集中的範例進行一般化預測。此資料集稱為訓練資料,而機器學習演算法會訓練此訓練資料,以產生可完成目標任務的機器學習模型。
例如,情感分析訓練資料由句子與其情感的組合所構成。機器學習演算法會讀取此資料集並產生模型,可傳送句子作為輸入並傳回其句子。這種模型,可將句子或文件作為輸入並傳回該輸入的標籤稱為文件分類模型。文件分類器也可以用來依所提及的主題分類文件。
序列對序列模型是最近新增 NLP 中使用的模型系列。序列對序列 (或 seq2seq) 模型將整個句子或文件作為輸入,但它會產生一個句子或其他一些序列作為輸出。
深度學習、預先訓練的模型及傳輸學習:深度學習是 NLP 中最廣泛使用的機器學習項目。透過與大腦做類比,簡單的機器學習模型有時被稱為「神經元」。這些神經元以圖層排列,深度神經網路是多層的網路。深度學習是使用深度神經網路模型的機器學習。